好奇心就像开关
原文:Curiosity is like an electric switch - supermemo.guru
摘要
好奇心像个开关,控制着高效的学习。通往高效学习之路,好奇心是最优解,也是唯一解。一旦我们把孩子送去学校,我们就有可能破坏这一开关。如果没有持续的数据供给,我们的智力将无法据此构建现实世界的模型,世界上的所有知识也就失去了价值。而好奇心开关恰恰是做到这一点的关键。我们需要好奇心来滋养智力!
电路比喻
为了描述学习内驱力的最优性,我们不妨假设一个学习内驱力电路。它的输入包括(1)一个人当下的记忆状态(即前置知识)和(2)待评估的新知识。它将输出在前置知识背景下,给定新知识的估值。
我们说好奇心是最优解,实际上是因为任何其他「电路」都无法对前置知识进行完整考量,所以无法胜任这个评估任务。教师尽可以阐释某份知识在绝对意义上或普遍意义上的价值,但这缺乏记忆状态的参与,故而学生无法从自己的角度评估知识的真正价值,导致这一块知识的碎片将无法嵌入整体知识的拼图中。
当我们获取一连串数据时,学习熵系统就会持续计算学习内驱力输出的滑动平均值。在此基础上,我们将分别评估获取外界信息的不同信道,并根据个体学习内驱力评估的最优性,选出一条最优的信道。而推动区概念却描述了在外界强迫下,人可能做出有益转换(包括从一条信道切换到另一条信道)的模型——然而,这一模型并没有否认评估、选择过程中的最优性;它之所以可能有益,是因为当我们只注重于抉择出的一条最优信道时,其他信道的信息往往就会被持续忽略。本来,我们的大脑通过探查的方式解决这一问题:即使信道 A 取得了比信道 B 更高的估值,但若在目前的认知背景下,个人对信道 B 保有着好奇心,那么信道 B 仍然随时可能被激活,尤其是在信道 A 的学习熵骤降的时候。大脑随机地采取这种探查行为,就像问题解决过程中采取创造性中断一样,因为大脑的学习内驱力算法无法保持某一信道的学习熵稳定——这也正是我们构建渐进阅读概念的基础。
外界强迫者(比如教师或家长)无法作出信道上的最优选择。虽然,在完全偶然的情况下,他们确实可能提升大脑探查信道的频率,从而提升学习熵的输出。但即使如此,外界的强迫还是应该降低到零,因为这种强迫的有益与否完全不可预料。并且,即使这种信道的切换是有益的,外界强迫带来的其他负面效应也可能与其抵消(例如,一个逼迫孩子的家长如果没有引发有益的信道切换,他的权威就会受损,孩子的反抗行为可能导致信道的估值被扭曲)。
对于人类族群来说,那些可能困住学习内驱力的局部优化是没有必要的。人类认知探索的整个过程是随机的,并且可能覆盖了那些最有希望对人类族群有益的发现。对于诺贝尔奖级别的独一无二的重大发现,我们还是得依靠创造性工作上的好运。信息领域存在着很多搜索算法,但绝大多数都无法匹敌在学习内驱力引导下,用健康的头脑武装自己的人类族群。
学习内驱力是最优的,因为它是唯一能够胜任知识估值任务的系统。
参见:
学校伤害
学校教育对学习内驱力的伤害,可以看作是破坏了好奇心这一回路。如果学校持续推翻这一处理器输出的控制信号,那这就是在烧毁回路。
而学习内驱力控制系统只有在完好无损的情况下,才能发挥它的最佳性能。就好像电灯开关也只有无损的情况才是最好的——如果它随着时间生锈,你大可以把生锈的部分移除,但那总是比不上全新且完整的开关。对于学习内驱力系统来说,即使我们存储的记忆状态不变,仍能够为学习内驱力的复苏提供必需的输入,可一旦系统本身出现了故障,它将很难获取清晰、一致的知识,从而抑制了创造力的涌现,最终无法为学习内驱力提供反馈激励。
故障的学习内驱力回路无法评估知识的价值。这就使得整体知识的拼图更为困难。见:导弹比喻。而基于广泛的知识,我们固然可以做出更好的抉择,但这并不等同于更好的学习内驱力控制系统。这就像,电灯发光的性能可能受到电力来源是否稳定的影响,但这不会影响它的开关,我们关于电灯开关完整性的论断仍然成立。知识估值系统的结构正像处理器和内存,学习内驱力回路的崩坏足以对这一系统的顶层决策机制造成损伤,从而低估我们在多年教育中收获的那些知识。这恰恰是学校教育的开始 2~5 年内所发生的事:我们童年的知识增长,被我们为了达到短期、按特定顺序且无语义的目标所采取的自律所主宰、所取代。死记硬背成为了家常便饭。
学习对于学习内驱力的恢复至关重要,然而,除非知识连贯且结构良好,否则知识本身并无疗效。这种优质知识是学习内驱力回路的摇篮,可这回路一旦受到损伤,获取优质知识就会变得困难。这就是为什么我们必须全盘抛弃学校内的强迫。否则,我们会接受混乱无序的知识流入,这相当于在人类智力的基础上挖空洞。
如果学习内驱力控制系统只是个软件的话,那么通过重构就可以简单地恢复它。如果它像比喻的那样,是个硬件电路,那么恢复就是不可能的,回路一旦被烧毁就无力回天。所幸,我们的大脑介于两者之间。不是所有的输入都是压迫的、无益的;而新的、有益的输入是可以培养的。外界输入和学习内驱力控制系统之间的界限目前还不明晰:它们之间有许多的反馈循环;它们拥有可塑性;它们的回路连接机制仍然不为我们所知。「处理器」和「内存」之间的界限就如同整个系统本身如何联通一样朦胧未知。(见:知识估值网络)
学校教育破坏了学习内驱力控制系统。
参见:
学习内驱力的准则
AI 研究者们知道好奇心的相对性。每个人都有自己的兴趣。人们倾向于认为,什么决定了好奇心,是个永远也没有统一答案的问题。然而,我们每个人的大脑都在出生时得到一套基于生存和幸福的准则。这些准则适应了这个世界,让生命体得以生存。正是这些准则决定了「什么是有趣的」。所有得以保留的兴趣,都是从这一名为「生存」的种子生长而来。对于 AI,如果我们一开始不设定任何优化的准则,智能和熵的法则让它仍然能产生一些东西。这就好像宇宙的诞生一样。智能将倾向于自我强化,这一论断,随着我们对宇宙的未来越来越深入的理解,也许很快会成为物理的一条新法则。
学习内驱力是人类智慧的钥匙。
对学习内驱力的伤害
图:秀丽隐杆线虫的神经系统仅由 302 个神经元组成。然而,这足以实现类似人类好奇心、创造力和问题解决能力的探索算法。当线虫找到一块食物时,它就会开始探索。偶尔,它会冲向某个随机的方向,寻找新的食物(细菌)。类似的算法也在其他动物中找到。然而,人类的学习内驱力要复杂得多。它基于知识估值,并且随机探索的行为会被留到学习熵远远低于预期的时候才被触发。人类的创造力基于知识,而线虫只是采取完全随机的行为。对于线虫来说,找到一块新食物就是「解决问题」;而人类的「解决问题」可能是关于火星地貌改造的新想法。最后但同样重要的是,我们对习得性无助(图中记作「学校」)的形成所作的比喻,在原始动物身上也许只会体现为染上了一种「驱动习惯」。然而,在解释我们的观点方面,这种小线虫可能比「智力导弹」的比喻要更具说服力,因为它更加普遍,并且可能与原始神经系统有关。欲了解更多关于学习内驱力的普遍性,请参阅:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4635443/